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摘要 : 

本 文 基于 图 神经 网 络 ， 提 出 了 一 种 用 于 工业 过 程控 制 回路 故障 诊断 的 方法 。 通 过 对 回路 传 感 
器 输出 信号 的 监测 ， 图 神经 网 络 能 够 捕捉 到 回路 中 的 异常 行为 ， 并 自动 诊断 回路 故障 类 型 。 实 验 
结果 表明 ， 该 方法 能 够 高 效 地 检测 到 回路 故障 ， 并 且 能 够 在 单 故障 和 多 故障 情况 下 都 实现 较 高 的 
准确 率 。 该 方法 为 工业 过 程控 制 提供 了 可 靠 的 故障 诊断 方案 ， 在 实际 工业 应 用 中 具有 重要 的 意义 
和 应 用 价值 。 
关键 词 ， 图 神经 卷 积 神经 网 络 ”控制 回路 ”故障 诊断 
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Abstract: 

This thesis proposes a method for industrial process control loop fault 
diagnosis based on graph neural networks. By monitoring the output signals of loop 
sensors, the graph neural network can capture abnormal behaviors in the loop and 
automatically diagnose the type of loop faults. Experimental results demonstrate 
that the proposed method can efficiently detect loop faults and achieve high 
accuracy in both single and multiple fault scenarios. This method provides a 
reliable fault diagnosis solution for industrial process control, which has 
important practical significance and application value in actual industrial 
applications. 
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1 绪论 


随 着 科技 和 社会 的 发 展 ， 工 业 过 程 和 控制 系统 日 益 复 如， 自动 控制 技术 广泛 应 
用 。 控 制 回路 是 现代 工业 控制 系统 的 基础 ， 由 控制 费 、 控 制 阀 和 变 送 器 组 成 ， 用 于 
稳定 参数 指标 。 然 而 ， 在 实际 工业 过 程 中 ， 控 制 回 路 可 能 发 生 故 障 ， 导 致 产品 质量 
下 降 和 成 本 增加 。 为 了 确保 工业 生产 的 稳定 和 安全 ， 故 障 诊断 至 关 重 要 。 

传统 故障 诊断 方法 依赖 专家 知识 和 经 验 ， 效 率 低 且 精度 不 高 。 数 据 驱 动 的 方 
法 ， 尤 其 是 基于 神经 网 络 的 方法 ， 近 年 来 备 受 关注 。 然 而 ， 传 统 神经 网 络 在 处 理 非 
欧 几 里 德 结构 数据 方面 存在 限制 。 为 了 克服 这 些 问题 ， 图 神经 网 络 (GNN) 成 为 研究 热 
点 ， 通 过 引入 图 结构 和 考虑 数据 之 间 的 相关 性 ， 提 高 了 故障 诊断 的 精度 和 效率 ”。 

在 工业 控制 回路 中 ， 故 障 点 与 相 邻 测量 数据 具有 一 定 的 相关 性 。 基 于 这 一 观 
察 ， 将 图 神经 网 络 应 用 于 控制 回路 的 故障 诊断 能 够 更 好 地 完成 相关 工作 ， 并 提供 对 
数据 的 解释 支持 。 因 此 ， 本 研究 则 在 验证 图 神经 网 络 在 工业 控制 回路 故障 诊断 中 的 
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性 能 是 否 优 于 传统 的 卷 积 神经 网 络 模型 。 值 得 注意 的 是 ， 图 


其 在 故障 诊断 领域 的 优势 之 一 ”。 
2 基础 理论 
2.1 图 卷 积 神经 网 络 (GCN) 原理 


思想 是 在 图 上 进行 卷 积 操作 ， 类 似 于 在 图 


图 卷 积 神经 网 络 (GCN) 是 一 种 用 于 处 理 图 结构 数据 的 深度 学 习 算法 。GCN 的 主要 
像 上 进行 卷 积 操作 。 在 GCN 中 ， 节 点 和 边 都 


神经 网 络 的 可 解释 性 是 


被 视 为 网 络 的 输入 数据 。GCN 使 用 邻接 矩阵 和 节点 特征 和 矩阵 来 进行 卷 积 操作 ， 邻 接 矩 


GCN 的 卷 积 过 程 可 以 分 为 两 步 。 首 


点 的 关系 , 这 个 过 程 被 称 为 消息 传递 。 其次, 将 节点 的 特征 向 各 
得 到 卷 积 后 的 节点 特征 向 量 。 这 个 过 程 可 以 通过 对 节点 特征 矩阵 和 邻接 矩阵 进行 乘法 


运算 和 加 法 运算 实现 ， 即 每 个 节点 都 外 


阵 表示 节点 之 间 的 连接 关系 ， 节 点 特征 矩阵 表示 节点 的 特征 向 量 。 


先 ， 通 过 邻接 矩阵 来 计算 每 个 节点 与 其 邻居 节 


EE 和 消息 向 量 进行 融合 ， 


提取 邻接 节点 的 特征 。 


GCN 的 层 数 可 以 根据 需要 增加 ， 每 一 层 的 输出 作为 下 一 层 的 输入 。 通 过 堆 登 多 个 
， 从 而 更 好 地 捕捉 图 结构 中 的 信息 和 关系 。 但 
是 由 于 GCN 的 特殊 性 一 一 在 图 结构 上 进行 卷 积 操作 ,这 大 大 减少 了 GCN 所 需要 的 层 数 。 


GCN 层 ， 可 以 提高 模型 的 深度 和 复杂 度 


举例 说 明 ， 布点 Al 在 第 一 层 都 获得 了 邻接 节点 B 的 特征 值 ， 输 出 A2， 而 节点 Bl 在 第 
一 层 获得 了 邻接 节点 C、D 的 特征 值 ， 输 出 B2。 那 么 在 第 二 层 中 ， 节 点 A2 再 提取 邻接 
节点 B2 的 特征 值 ， 其 实 也 提取 到 了 C、D 的 特征 值 。 这 个 特点 可 以 让 GCN 用 很 少 的 层 


数 获取 全 局 信息 ”。 


总 的 来 说 ，GCN 是 一 种 用 于 处 理 医 


卷 积 操作 来 提取 节点 的 特征 ， 可 以 实现 对 图 


2.2 控制 回路 GCN 结构 


空 制 回路 GCN 结构 中 的 关键 环节 是 构建 图 结构 。 图 神经 网 络 中 的 图 结构 数据 是 由 
制 回路 中 ,选择 控制 器 输出 《OP)、 控 制 阔 输 
制 回路 图 结构 的 节点 特 


节点 特征 和 节点 间 的 边关 系 组 成 的 ,在 控 
出 (MV)、 回 路 输出 PV) 和 变 送 器 输出 〈T0) 四 组 数据 作为 控 


结构 数据 的 深度 学 习 算法 ， 


它 通 过 在 图 上 进行 
数据 的 分 类 、 预 测 和 表示 学 习 等 任务 。 


征 。 对 于 边关 系 的 选择 ， 有 无 向 图 和 有 疝 图 两 个 选择 ， 有 疝 图 和 无 向 图 都 可 以 用 于 表 


示 变 量 之 间 的 耦合 关系 ， 但 是 它们 各 自 的 特点 不 同 “。 
无 向 图 通常 用 于 描述 物理 系统 、 社 交 网 络 、 交 通 网 络 等 


领域 。 这 些 领域 中 ， 变 量 


之 间 的 相互 影响 和 对 称 性 往往 更 为 重要 ， 因 此 无 向 图 能 够 更 好 地 表示 变量 之 间 的 关系 。 


此 外 ， 无 向 图 的 邻接 矩阵 通常 是 对 称 和 矩阵 ， 使 得 在 构建 CCN 时 更 为 简便 。 
有 向 图 通常 用 于 描述 生物 网 络 、 电 路 网 络 等 领域 。 这 些 领 域 中 ， 


关系 和 流向 性 更 为 重要 ， 因 此 有 向 图 


矩阵 通常 是 非 对 称 和 矩阵， 需要 更 为 复杂 的 计算 方式 。 


在 工业 过 程控 制 回路 中 进行 故障 诊断 时 ， 考 虑 到 变量 
果 关 系 和 流向 性 ， 选 择 使 用 有 向 图 来 构建 控制 回路 的 图 结构 更 为 合 
OD 控制 器 输出 与 控制 闪 输 出 之 间 的 边关 系 ， 控 制 器 输出 作为 控 


变量 之 间 的 因果 


能 够 更 好 地 表示 变量 之 间 的 关系 。 有 向 图 的 邻接 
廿 之 间 的 复杂 耦合 关系 以 及 因 


适 。 有 具体 而 言 : 


制 阀 的 输入 信和 号 


因此 在 有 向 图 结构 中 ， 应 该 从 控制 器 输出 节 le 空 制 阀 输出 节 反 。 


二 上- 
节点 。 


@@ 控 制 回路 输出 与 变 送 器 输出 之 间 的 边 : 


名 控制 阀 输出 与 控制 回路 输出 之 间 的 边 : 控制 阀 输出 经 过 一 定 的 处 理 后 ， 会 得 到 
空 制 回路 输出 信号 ， 因 此 在 有 向 图 结构 中 ， 有 这 拓 庆 


制 阀 输出 节点 指向 控制 回路 输出 


空 制 回 路 输出 作为 变 送 器 的 输入 信和 号 ， 


因此 在 有 向 图 结构 中 ， 应 该 从 控 制 回路 答 出 节点 指向 变 送 器 输出 节点 


由 因为 有 反馈 回路 ， 则 需要 从 变 送 器 输出 节点 指 疝 
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空 制 器 ， 表 示 反 馈 回 路 中 的 信 


号 作为 控制 器 输入 的 一 部 分 ” 。 
综 上 ， 构 建 出 的 控制 回路 图 结构 如 图 2-1 和 2-2 所 示 。 


OP >MV PV 


Es 


图 2-1 控制 回路 结构 


节点 1(OP) 节点 2(MV) 


节点 4(TP) 节点 3(PV) 


图 2-2 控制 回路 图 结构 

确定 了 节点 特征 和 邻接 和 矩阵， 就 可 以 构建 出 图 数据 集 ， 分 为 训练 集 和 测试 集 。 将 
训练 集 放 进 图 卷 积 神经 网 络 的 分 类 模型 中 进行 模型 训练 。 步 又 如 下 : 

定义 一 个 基于 GCN 的 分 类 模型 ， 包 含 2-3 个 GCN 层 和 激活 函数 、 正 则 化 操作 等 ， 
定义 优化 器 和 损失 函数 。 在 GCN 分 类 模型 中 循环 训练 批量 数据 ， 每 次 循环 都 要 经 过 梯 
度 清 零 、 前 向 传播 、 计 算 损 失 值 、 反 辐 传 播 和 参数 优化 ,经 过 多 次 迭代 训练 后 ，GCN 模 
型 的 性 能 会 逐步 提升 。 

模型 训练 完成 后 ， 将 测试 集 输入 GCN 模型 对 测试 数据 进行 预测 ， 然 后 计算 预测 的 
准确 率 。 步 又 如 下 : 将 测试 数据 集 分 批 打 乱 ， 输 入 训练 好 的 GCN 模型 。 在 测试 过 程 中 
只 需要 进行 前 向 传播 ， 得 到 预测 结果 。 将 预测 结果 对 应 的 最 大 概率 类 别 作 为 预测 的 类 
别 ， 与 真实 类 别 标签 进 行 对 比 ， 计 算 并 输出 最 后 的 预测 准确 率 ”。 

对 控制 回路 GCN 的 原理 进行 总 结 : 

通过 向 GCN 模型 中 输入 图 结构 形式 的 训练 集 和 测试 集 ， 并 通过 前 向 传播 将 节点 和 
边 的 特征 信息 进行 整合 ， 输 出 每 个 节点 的 特征 表示 。 接 着 ， 将 这 些 特征 表示 输入 全 连 
接 层 进行 分 类 ， 模 型 可 以 对 图 数据 进行 分 类 任务 。 训 练 过 程 中 ， 模 型 会 使 用 训练 数据 
对 参数 进行 更 新 所 ， 通 过 多 次 欠 代 训练 ， 不 断 优 化 模型 的 性 能 。 在 测试 过 程 中 ， 将 测 
试 数 据 输入 到 已 经 训练 好 的 模型 中 ， 进 行 前 向 传播 ， 得 到 每 个 节点 的 预测 结果 ， 通 过 
取 预 测 概率 最 大 的 类 别 作为 预测 结果 。 通 过 这 种 方法 ， 可 以 有 效 地 对 图 数据 进行 分 类 
任务 。 


2.3 学习 算法 

在 图 神经 网 络 中 ， 用 邻接 矩阵 A、 度 矩阵 D 来 表示 节点 间 的 关系 。 

邻接 矩阵 A 用 来 表示 图 结构 中 节点 之 间 的 关系 , 在 有 向 图 中 ， 如果 节 点 NW 和 和 Vv 之 
间 有 Ni 指向 NN 的 边 ， 则 Es=1， 否 则 =0。 至 于 无 向 图 ， 如 果 NN 和 NN 之 间 有 边 连接 ， 则 
Eis=BE,=1。 

度 和 矩阵 D 中 ， 度 表示 每 个 节点 与 其 相连 接 边 的 数目 ， 各 个 节点 的 度 在 矩阵 对 角 线 
上 ， 组 成 的 矩阵 就 是 度 窍 阵 。 

邻接 矩阵 和 度 和 矩阵 的 例 图 如 图 2-3 所 示 。 

邻接 矩阵 A 度 和 矩阵 D 


1 请 了 2 0 0 
me 0 2 0 0 
(4) 0 1 0 1 0 0 2 0 
1 0 1 0 和 渐 丰 党 


图 2-3 邻接 矩阵 和 度 和 矩阵 例 图 
一 组 图 数据 由 N 个 节点 组 成 ， 每 个 节点 有 MM 个 特征 值 ， 可 以 得 到 一 个 大 小 为 NX 
M 的 卷 积 特征 矩阵 Xx， 和 NXN 的 邻接 矩阵 A，A 和 X 即 为 G6CN 模型 的 输入 。 
GCN 网 络 提取 目标 节点 邻接 点 特征 信息 , 通过 一 般 2-3 个 传播 层 来 获得 全 局 信息 ， 
更 新 目标 节点 特征 值 。 前 向 传播 的 图 卷 积 神经 网 络 ， 每 一 层 的 输出 HL+L 为 一 个 非 线 
性 函数 表示 ， 可 描述 为 式 2-1。 


We 
Ht = o (DzADz HIWI) Cl 


其 中 ，Hl 是 当前 层 输入 的 特征 ， 如 果 是 输入 层 ， 则 是 卫 = X; A=A+I，A 是 节点 


邻接 矩阵 ，I 是 单位 矩阵 ;DD 是 A 的 对 角 线 度 和 矩阵 ，o 是 非 线 性 激活 函数 ， 员 是 当前 


层 的 权重 矩阵 ”。 

对 于 非 线性 激活 函数 c， 图 神经 网 络 中 的 每 个 节点 都 会 接收 来 自前 一 层 节点 的 输 
入 ， 进 行 一 系列 线性 变换 ， 并 通过 激活 函数 进行 非 线性 转换 ， 最 终 输 出 给 下 一 层 的 节 
点 。 激 活 函 数 的 作用 是 将 节点 的 输出 映射 到 非 线性 空间 ， 这 样 图 神经 网 络 才能 够 捕捉 
到 复杂 的 非 线性 关系 ， 使 图 神经 网 络 能 够 学 习 到 非 线 性 模式 。 

如 果 没 有 激活 函数 ， 图 神经 网 络 就 只 能 进行 线性 变换 ， 无 法 学 习 到 复杂 的 非 线 性 
模式 ， 因 此 激活 函数 对 于 图 神经 网 络 的 性 能 至 关 重 要 。 常 用 的 激活 函数 有 sigmoid 函 
数 、tanh 函数 、ReLU 函数 等 ， 在 控制 回路 GCN 中 ， 选 择 的 是 ReLU 激活 函数 。 

ReLU (Rectified Linear Unit) 激 活 函 数 是 一 种 常用 的 非 线 性 激活 函数 。 其 表达 
式 为 :f(x)=max (0, x)， 即 当 输 入 小 于 0 时 ， 输 出 为 0， 当 输入 大 于 等 于 0 时 ， 输 出 等 
于 输入 。 简 单 来 说 ，ReLU 激活 函数 会 将 小 于 0 的 值 设 为 0， 大 于 等 于 0 的 值 不 变 。 

ReLU 激活 函数 具有 简单 的 计算 方式 , 能 够 有 效 地 缓解 梯度 消失 问题 并且 具有 良 
好 的 表达 能 力 和 加 速 收敛 的 效果 ， 因 此 在 深度 学 习 中 被 广泛 使 用 。 

经 过 全 部 卷 积 层 ， 完 成 数据 的 前 向 传播 后 ， 目 标 节点 聚合 了 邻 节 点 高 度 抽象 化 的 
特征 , 通过 进行 1D 全 局 最 大 池 化 操作 , 得 到 一 个 具有 全 局 最 大 节点 特征 的 输出 结果 。 
1D 全 局 最 大 池 化 操作 会 在 每 个 通道 上 找到 输入 序列 中 的 最 大 值 , 并 将 其 作为 输出 张 量 
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对 应 通道 的 值 。 在 整个 序列 中 只 保留 每 个 通道 的 最 大 值 ， 其 它 位 置 的 值 被 忽略 ， 这 样 
可 以 有 效 地 提取 出 每 个 通道 中 的 最 显著 特征 ， 即 分 类 预测 的 结果 。 
得 到 预测 结果 后 ， 用 交叉 业 损 失 函 数 来 判断 模型 的 准确 率 ， 描 述 为 式 2-2。 


Lee(y,y) = 一 1og EC (2-2) 


其 中 , y 代表 对 节点 的 预测 类 别 , 代表 节点 的 真实 类 别 , C 是 节点 分 类 的 类 数 。 

得 到 了 模型 的 损失 值 Loss 后 ， 进 行 反 向 传播 ， 计 算 每 个 参数 的 梯度 ， 通 过 优化 
器 更 新 参数 ,使 当前 输入 数据 上 的 损失 率 得 到 降低 ,在 控制 回路 GCN 中 ,选择 的 是 Adam 
优化 器 。 

Adam (Adaptive Moment Estimation) 算 法 是 一 种 自 适 应 学 习 率 的 优化 算法 ， 可 
以 用 于 更 新 神经 网 络 中 的 权重 参数 。 它 是 一 种 基于 梯度 下 降 的 算法 ， 结 合 了 RMSprop 
和 动量 (momentum) 方 法 的 思想 。 

Adam 算法 的 核心 原理 是 使 用 动量 梯度 下 降 法 来 更 新 权重 参数 。 它 在 计算 梯度 时 ， 
不 仅 考虑 了 梯度 的 一 阶 矩 (平均 值 ) ， 还 考虑 了 梯度 的 二 阶 矩 (方差 ) ， 并 且 对 二 阶 和 矩 做 
了 一 个 指数 加 权 平 均 。 这 样 做 的 好 处 是 可 以 让 学 习 率 根据 梯度 的 大 小 和 稳定 性 来 自 适 
应 地 调整 ， 从 而 在 更 新 权重 参数 时 更 加 准确 、 稳 定 。 其 中 Adam 优化 器 的 学 习 率 一 般 
设置 在 0. 001 至 0.1 之 间 ， 学 习 率 设置 得 较 大 ， 可 以 加 快 收敛 速度 但 有 可 能 使 模型 
失去 精度 反之 ， 如 果 学 习 率 设置 得 较 小 ， 则 可 能 需要 更 多 的 时 间 来 收敛 ， 但 通常 可 
以 得 到 更 精确 的 结果 。 具 体 数 值 需要 根据 具体 问题 进行 调整 。 

具体 算法 的 计算 流程 如 下 : 

QD 计算 梯度 :使 用 反 向 传播 算法 计算 当前 权重 参数 的 梯度 。 

包 计 算 一 阶 矩 (平均 值 ) :对 梯度 的 一 阶 矩 (平均 值 ) 进行 指数 加 权 平 均 ， 得 到 梯度 
的 移动 平均 值 。 

@ 计 算 二 阶 矩 (方差 ) : 对 梯度 的 二 阶 矩 (方差 ) 进行 指数 加 权 平 均 ， 得 到 梯度 平方 
的 移动 平均 值 。 

由 计算 偏差 校正 : 由 于 指数 加 权 平 均 会 使 得 一 阶 和 矩 和 二 阶 矩 的 初 值 很 小 ， 因 此 需 
要 进行 偏差 校正 ， 使 得 平均 值 更 接近 真实 值 。 

@@ 更 新 权重 参数 :根据 一 阶 矩 和 二 阶 矩 计算 出 权重 参数 的 更 新 值 ， 使 用 动量 法 更 
新 权重 参数 。 

Adam 算法 的 优点 是 具有 较 快 的 收敛 速度 和 较 好 的 适应 性 , 可 以 自 适应 地 调整 学 习 
率 ， 同 时 还 具有 较 强 的 鲁 棒 性 ， 不 容易 受到 超 参 数 的 影响 。 
3 实验 
3.1 控制 回路 单 故 障 分 类 

(1) 故障 数据 集 

对 于 控制 回路 单 故障 , 通过 Simulink 仿真 获取 了 45 组 正常 数据 、70 组 控制 器 品 
声 数据 、70 组 控制 器 参数 改变 数据 、45 组 阀门 粘 滞 数据 、50 组 阀门 恒 偏 差 数 据 、70 
i 一 共 420 组 ， 每 组 4X150 个 数据 。 
给 上 述 7 类 数据 打上 0、1、2、3、4、5、6 的 标签 ， 用 于 构建 图 标签 数据 。 

人 因为 噪声 故障 、 恒 偏差 故障 都 在 55s-65s 间 加 入 回路 ， 
观察 各 类 故障 的 数据 图 像 ， 可 以 发 现 60s-85s 的 数据 曲线 有 明显 的 故障 特征 。 所 以 在 
150s 数据 中 ， 只 需要 提取 56s-95s 的 40 个 包含 了 故障 特征 的 数据 作为 数据 集 ， 大 大 
减少 了 数据 量 。 

将 420 组 4X40 的 控制 回路 故障 数据 、 预 处 理 好 的 图 结构 4X4 邻接 矩阵 和 每 类 
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故障 1X7 的 标签 数据 都 转换 成 Tensor 类 型 ， 生 成 控制 回路 单 故 障 的 数据 集 。 

对 数据 进行 处 理 , 每 批 次 数据 的 数量 为 30。 此 时 得 到 的 控制 回路 单 故 障 数据 集 包 
含 14 个 batch, 每 个 batch 由 标签 为 x 的 120X40 节点 特征 集合 、 标 签 为 edge_index 
的 2X120 边关 系 集合 、 标 签 为 y 的 30X7 的 图 分 类 标签 集合 组 成 。 

流程 图 如 图 3-1 所 示 。 


读 取 故 障 数据 


图 数据 


图 标签 (0-6) 


节点 及 节点 节点 和 边 的 
特征 [4,40] 邻接 矩阵 [4.,4] 


数据 转换 为 
Tensor 类 型 


创建 故障 数据 
集 对 象 


3-1 数据 集 构建 
(2) GCN 故障 分 类 

把 单 故障 数据 集 分 为 用 于 训练 GCN 模型 性 能 的 训练 集 和 用 于 测试 故障 分 类 模型 结 
果 的 测试 集 ， 将 前 360 组 数据 划分 为 训练 集 、 后 60 组 数据 划分 为 测试 集 。 

在 模型 训练 部 分 中 ， 首 先导 入 相关 的 库 文件 ， 在 搭建 好 图 神经 网 络 模型 后 ， 输 入 
训练 集 数 据 图 , 通过 向 优化 器 反馈 学 习 速 率 , 在 迭代 中 改进 参数 , 以 完成 模型 的 训练 。 
训练 具体 步骤 如 下 : 

Q@ 定 义 了 一 个 单 故障 分 类 GCN 模型 ， 包 含 两 层 卷 积 层 和 一 个 全 局 池 化 层 。 

@@ 定 义 了 前 向 传播 函数 forward, 其 中 通过 data 参数 输入 节点 特征 和 边 的 稀 跑 矩 
阵 ， 并 通过 GCN 卷 积 层 和 ReLU 激活 函数 进行 运算 ， 通 过 两 个 GCN 卷 积 层 和 池 化 层 输 
出 一 个 7 维度 结果 ， 对 应 7 分 类 任务 的 预测 结果 。 

@ 完 成 GCN 模型 的 构建 ， 并 定义 了 一 个 Adam 优化 器 和 一 个 交叉 炉 损失 函数 ， 其 
中 Adam 优化 器 的 学 习 参 数 设 定 为 0. 005。 

加 载 训练 数据 集 ， 并 使 用 DataLoader 分 批 次 加 载 每 30 个 数据 。 

@@ 开 始 模型 的 训练 ， 对 所 有 训练 数据 集 进行 200 次 迭代 (epoch=200) 。 

@ 对 于 每 个 迭代 过 程 中 的 每 个 批 次 数据 ， 执 行 以 下 操作 : 

梯度 清 零 :保证 每 次 迭代 都 从 零 开 始 计 算 梯度 ， 防 止 梯 度 累 积 导 致 训练 不 稳定 ， 
确保 参数 更 新 的 正确 性 ， 同 时 提高 内 存 效率 。 

进行 前 向 传播 : 输入 的 特征 X 是 一 个 120X40 的 张 量 ， 通 过 两 个 卷 积 层 的 计算 ， 
X 降 为 120X7。 再 经 过 池 化 层 的 最 大 池 化 操作 , X 降 为 30X7， 即 bacth 为 30 的 七 分 
类 预测 结果 。 


计算 损失 函数 : 用 交叉 烂 损失 函数 来 判断 模型 的 准确 率 ( 式 3-2)。 

反问 传播 : 从 输出 层 开始 ， 根 据 链 式 法 则 计算 每 个 节点 对 应 的 梯度 。 将 梯度 沿 着 
网 络 的 反方 向 传播 回 输 入 层 。 在 传播 过 程 中 ， 使 用 链 式 法 则 将 上 一 层 的 梯度 乘 以 当前 
层 的 局 部 梯度 ， 以 计算 当前 层 的 梯度 。 这 样 ， 每 个 参数 都 可 以 得 到 相应 的 梯度 。 

更 新 模型 参数 : 根据 计算 得 到 的 梯度 ， 使 用 Adam 算法 来 更 新 模型 的 参数 。 用 于 
优化 模型 、 收 敛 到 最 优 解 、 适 应 新 数据 和 提升 模型 鲁 棒 性 。 

记录 损失 总 值 :监控 训练 进度 ， 判 断 模 型 收敛 ， 并 支持 可 视 化 分 析 。 

@ 训 练 完 成 后 ， 保 存 到 一 个 model 文件 ， 用 于 后 续 的 测试 操作 。 

流程 图 如 图 3-2 所 示 。 


导入 故障 数据 集 


构造 GCN 模 型 0-360 训 练 集 360-420 测 试 集 


GCN 第 1 层 


反 向 传播 


保存 训练 完成 
更 新 模型 参数 训练 200 次 的 GCN 模 型 


计算 损失 值 


完成 一 次 模型 训练 


3-2 训练 GCN 模型 
向 训练 好 的 模型 输入 测试 集 数据 图 以 得 到 设计 的 GCN 模型 对 测试 集 预 测 的 准确 
率 ， 从 而 判断 模型 性 能 。 有 具体 测试 步骤 如 下 : 
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定义 空 列表 preds 和 label 来 存储 预测 标签 和 真实 标签 。 

包 使 用 DataLoader 函数 读 取 测试 数据 集 ，batch=30， 打 乱 数 据 集 

@) 关 闭 梯 度 计算 ， 以 提高 预测 效率 。 

(对 于 loaders 中 的 每 个 batch 中 的 数据 进行 预测 , 其 中 predata 表示 每 个 batch 
中 的 数据 。 

@@ 使 用 model 函数 对 每 个 batch 的 数据 进行 预测 ， 得 到 tensor 格式 的 结果 。 

@ 将 tensor 转化 为 NumPy 数组 ， 并 将 每 个 预测 结果 pred 添加 到 preds 列表 中 。 

@ 将 每 个 batch 的 真实 标签 添加 到 label 列表 中 。 

@ 对 于 pred 数组 中 的 每 个 元 素 ， 预 测 概率 最 大 的 标签 值 ， 并 将 该 标签 值 添加 到 
preds 列表 中 。 

@ 将 preds 列表 中 的 元 素 压缩 成 一 个 一 维 数组 ， 并 将 其 转化 为 列表 格式 。 此 时 ， 
preds 列表 中 的 每 个 元 素 即 为 预测 标签 。 

@@ 将 label 列表 展开 为 一 个 一 维 列 表 ， 以 得 到 整个 测试 集 上 的 真实 标签 。 

最 终 , 可 以 对 比 60 组 测试 集 数据 的 预测 标签 preds 和 真实 标签 label， 以 评估 模 
型 在 测试 集 上 的 性 能 。 

流程 图 如 图 3-3 所 示 。 


导入 故障 数据 集 


360-420 测 试 集 0-360 训 练 集 
训练 好 的 GCN 模型 


GCN 第 1 层 


图 卷 积 运算 


GCN 第 2 层 


图 卷 积 运算 于 池 化 降 维 


7 分 类 结果 


计算 模型 分 类 
预测 的 准确 率 


输出 GCN 的 预测 准 
确 率 和 损失 值 


3-3 测试 GCN 模型 
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(3) 结果 分 析 
将 测试 集 输入 训练 好 的 GCN 模型 ， 得 到 了 60 组 测试 集 数 据 的 分 类 预测 结果 ， 同 


率 


时 ， 用 CNN“《〈 卷 积 神经 网 络 ) 对 相同 数据 进行 分 类 预测 ， 以 对 比 两 种 模型 的 预测 准确 


拟 使 用 训练 200 次 的 Adam 优 化 器 2 层 GCN 与 训练 200 次 /1000 次 的 Adam/Adadelta 


优化 器 2 层 /3 层 CNN 进行 对 比 ，CNN 使 用 的 数据 集 同样 是 420 组 故障 数据 。 主 要 对 比 
的 内 容 是 测试 集 得 到 的 损失 值 和 准确 率 大 小 ， 对 比 结果 如 表 3-1 所 示 。 
表 3-1 GCN 与 CNN 的 分 类 准确 率 和 损失 值 


训练 Adadelta 优化 器 Adan 优化 器 
2 层 CNN 训练 200 次 Accuracy:0. 615 Loss:1.518 Accuracy:0.929 Loss:0.052 
3 层 CNN 训练 200 次 Accuracy:0. 810 Loss:0.957 
2 层 CNN 训 练 1000 次 Accuracy:0.731 Loss:0. 904 Accuracy:0.964 Loss:0.037 
3 层 CNN 训 练 1000 次 Accuracy:0.746 Loss:0. 899 
2 层 GCN 训练 200 次 Accuracy:0.967 Loss:0. 009 


根据 表格 所 示 结 果 ， 在 工业 过 程控 制 回 路 单 故障 诊断 方面 ， 使 用 训练 200 次 的 2 
层 Adam 优化 器 GCN 在 工业 过 程控 制 回 路 故障 诊断 准确 率 相 较 于 训练 200 次 和 1000 次 
的 2 层 和 3 层 Adadelta 优化 器 CNN 都 明显 更 优 ， 不 管 是 准确 率 还 是 损失 值 都 是 GCN 
明显 更 优 ， 而 对 于 训练 200 次 和 1000 次 的 2 层 Adam 优化 器 CNN， 训 练 200 次 的 GCN 
的 准确 率 和 损失 值 也 要 更 高 一 筹 ， 说 明 GCN 需要 的 网 络 层 数 和 训练 次 数 都 少 于 CNN， 
且 还 能 得 到 较 好 的 分 类 结果 。 


综合 上 述 结果 可 以 判断 : 在 工业 过 程 简 单 控制 回路 的 单 故障 诊断 方面 ， 使 用 带 有 
先 验 知识 约束 ， 具 有 图 


络 。 


2.2 控制 回路 多 故 


(1) 故障 


数据 集 


在 工业 过 程控 


结构 的 图 


障 分 类 


判 回路 的 单 故障 诊断 方面 ， 可 以 看 出 GCN 比 CNN 更 优 ， 但 是 由 


卷 积 神经 网 络 模型 的 性 能 明显 优 于 普通 的 卷 积 神经 网 


于 是 


单 故障 的 故障 诊断 ， 故 障 数据 的 复杂 程度 方面 可 能 体现 不 出 来 图 结构 在 卷 积 神经 网 络 
中 的 重要 性 ， 同 时 也 考虑 到 现实 中 也 可 能 出 现 控 制 回 路 中 多 个 组 件 同时 故障 的 情况 ， 
所 以 设计 获取 “阀门 恒 偏差 + 变 送 咒 恒 偏 差 ” “阀门 粘 灌 + 变 送 右 恒 增 益 ””“ 控 制 器 参 


数 改 变 + 阀门 恒 偏差 ”“ 控 


进行 多 故障 分 类 。 
通过 提高 故障 数据 的 复杂 程度 后 ， 再 分 析 GCN 处 理 多 故障 分 类 的 结果 ， 以 证 明 在 


GCN 可 以 处 下 


的 结果 。 


复杂 情况 下 控制 
用 有 癌 图 的 构图 方法 ， 在 处 至 


回路 的 故障 分 类 问题 。 


判 器 噪声 + 阀门 粘 清 ”四 种 单 回 路 多 故障 的 故障 类 型 , 用 GCN 


测试 在 工业 过 程 的 控制 回路 中 使 


更 复杂 的 多 故障 数据 时 ， 是 否 仍然 可 以 得 到 一 个 比较 好 


其 中 ,“ 阀 门 恒 偏差 + 变 送 器 恒 偏差 ”故障 一 共 获 取 了 100 组 ， 分 别 是 25 组 阀门 
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负 偏 差 + 变 送 器 正 增益 、25 组 阀门 负 偏差 + 变 送 器 负 增 益 、25 组 阀门 正 偏差 + 变 送 右 下 
增益 、25 组 阀门 正 偏差 + 变 送 器 负 增 益 。 

对 于 控制 回路 多 故障 一 共 获 取 了 280 组 150 个 故障 数据 ， 同 样 提取 其 中 56s-95s 
的 40 个 数据 构建 多 故障 数据 集 。 给 上 述 4 类 故障 打上 0、1、2、3 的 标签 ， 用 于 构建 
图 标签 数据 。 

将 处 理 后 的 280 组 4X40 的 数据 、 图 结构 4X4 的 邻接 矩阵 和 每 类 故障 1X4 的 标 
签 数 据 都 转换 成 Tensor 类 型 ， 以 大 小 为 20 的 batch， 打 乱 顺 序 后 生成 控制 回路 多 故 
障 的 数据 集 。 

此 时 得 到 的 控制 回路 多 故障 数据 集 包 含 14 个 batch， 每 个 batch 由 标签 为 x 的 
80X40 节点 特征 集合 、 标 签 为 edge_index 的 2X80 边关 系 集合 、 标 签 为 y 的 20X7 
的 图 分 类 标签 集合 组 成 。 

(2) GCN 故障 分 类 

多 故障 分 类 的 GCN 模型 与 单 故障 分 类 GCN 一 致 ， 唯 一 区 别 是 输入 的 数据 集 换 成 了 
多 故障 数据 集 ， 将 前 250 组 数据 划分 为 训练 集 ， 后 30 组 数据 划分 为 训练 集 。 

(3) 结果 分 析 

多 故障 分 类 的 两 层 GCN 模型 经 过 了 200 次 训练 ， 其 损失 值 在 第 20 次 训练 时 为 
0. 1105， 而 在 200 次 训练 后 ， 损 失 值 降 至 了 0. 0017， 模 型 训练 的 效果 理想 。 故 障 分 类 
的 测试 结果 表现 同样 很 好 ， 对 30 组 测试 数据 的 真实 标签 预测 准确 率 达 到 了 100%。 这 
个 结果 足以 证 明 GCN 不 仅 能 够 在 控制 回路 单 故 障 分 类 中 有 很 好 的 性 能 ,在 更 加 复杂 的 
多 故障 分 类 中 也 可 以 取得 优秀 的 结果 。 

此 外 ， 在 构建 单 故 障 和 多 故障 的 图 结构 时 ， 选 择 的 是 可 以 更 好 地 表示 变量 之 间 的 
因果 关系 和 流向 性 的 有 向 图 方法 ， 而 在 单 故 障 和 多 故障 情况 下 ， 有 向 图 都 取得 了 很 高 
的 分 类 准确 率 。 证 明 在 基于 GCN 的 工业 过 程控 制 回路 故障 分 类 问题 上 ,使 用 有 向 图 的 
效果 很 好 。 


4 结论 


传统 控制 回路 故障 诊断 方法 存在 成 本 高 、 时 间 长 、 效 率 低 和 精度 不 高 等 问题 ， 难 
以 应 对 复杂 工业 过 程 。 卷 积 神经 网 络 (CNN) 作为 深度 学 习 的 典型 方法 在 数据 结构 上 
一 定局 限 性 。 本 文 介绍 了 图 卷 积 神经 网 络 (GCN) 在 深度 学 习 中 的 原理 和 算法 ， 并 
将 其 应 用 于 控制 回路 的 单一 故障 分 类 和 多 重 故 障 分 类 问题 。 

在 GCN 的 结构 和 原理 介绍 中 ， 总 结 出 以 下 几 点 : 

1、GCN 相 较 于 CNN， 通 过 图 卷 积 操作 可 处 理 任意 大 小 和 任意 连接 的 非 欧 几 里 德 结 
构 数据 《〈 如 图 形 和 社交 网 络 )， 并 能 获得 全 局 信息 而 无 需 多 次 卷 积 和 池 化 。 

2、 在 单一 故障 分 类 问题 中 ， 使 用 GCN 模型 相对 于 CNN 模型 ， 同 样 能 够 达到 95% 以 
上 的 高 分 类 准确 率 ， 且 GCN 的 网 络 层 数 更 少 、 训 练 次 数 更 少 ， 具 有 显著 的 效率 优势 。 

在 多 重 故 障 分 类 问题 中 ,通过 使 用 更 复杂 的 多 故障 数据 进行 6CN 分 类 模型 的 分 析 ， 
可 以 证 明 ， 在 工业 控制 回路 中 ， 选 择 变量 间 因 果 关 系 和 流向 性 更 强 的 有 向 图 来 构建 图 
数据 是 明智 的 选择 ， 基 于 有 向 图 的 GCN 模型 在 单一 和 多 重 故 障 分 类 问题 上 表现 出 色 。 

不 过 ,在 实验 中 也 发 现 一 些 问题 ,尽管 GCN 在 控制 回路 图 结构 构建 方面 是 创新 的 ， 
但 对 于 时 序数 据 的 预测 并 非 CNN 的 强项 。 下 一 步 研究 方向 可 以 考虑 将 动态 图 神经 网 络 
(DGNN) 应 用 于 控制 回路 故障 诊断 。 与 GNN 不 同 ，DGNN 具有 动态 图 结构 ， 可 在 训练 中 
增加 或 减少 节点 和 边 ， 更 适合 处 理 控制 回路 故障 数据 这 类 具有 动态 特征 的 问题 。 
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